Go 语言 Green Tea 垃圾回收器的“简单”革命

详细介绍请参考官方博客：https://go.dev/blog/greenteagc

引言：便利背后的隐形成本

对于 Go 开发者来说，垃圾回收（GC）带来的巨大 CPU 开销是一个老生常谈的问题。Go 程序将 20% 或更多的 CPU 时间花费在垃圾回收上并不罕见。这笔开销是我们为内存管理的便利性所付出的代价。

但如果有一个看似简单的想法，就能消除这其中大部分的开销，那会怎样呢？

Go 1.25 中引入的全新实验性垃圾回收器——Green Tea，正是这个问题的答案。本文将深入探讨它的工作原理，以及它为何能为现代硬件带来如此显著的性能提升。

1. 传统方式：一场“微架构的灾难”

Go 传统的垃圾回收器基于“标记-清除”（mark-sweep）算法，其核心可以被描述为一场“图遍历”（graph flood）。它从根对象（如全局变量）出发，追踪程序中所有的指针，标记所有可达的对象。

这种方法的核心问题在于：它会在内存中四处跳转来追踪对象。这种行为对于依赖缓存和可预测性的现代 CPU 来说，效率极低。但问题在于，没有任何机制能保证相互引用的两个对象在内存中也是相邻的。图遍历算法完全没有考虑这一点，导致了大量的缓存未命中。

“图遍历算法对 CPU 来说，就像在城市街道里开车。CPU 无法预见拐角后的情况，也无法预测接下来会发生什么。引擎再快也无济于事，因为你根本没有机会提速。”

更糟糕的是，硬件的发展趋势（如 NUMA 架构和每核心内存带宽的降低）正在让这个问题变得越来越严重。

2. 解决方案出奇的简单：“面向页，而非对象”

Green Tea 的核心理念简单得惊人：“面向页工作，而不是面向对象。”

在实践中，这意味着垃圾回收器不再追踪和扫描单个对象，而是转为追踪和扫描整个内存页。

回到我们开车的比喻：这种新方法就像驶离了拥堵的城市街道，开上了高速公路。它在内存上创造了“更少、更长的从左到右的扫描”，这种方式对现代 CPU 的缓存机制要友好得多。我们现在可以极高概率地扫描到在内存中彼此靠近的对象，从而大大提升利用缓存、避免访问主内存的机会。同样，每个内存页的元数据也更有可能位于缓存中。

这一改变带来的性能影响是巨大的：仅此一项，就在许多工作负载中将垃圾回收的 CPU 成本降低了 10% 到 40%。